Análisis geoestadístico y de patrones de puntos

Residencia de Epidemiología

Datos geoestadísticos


  • Los datos geoestadísticos proporcionan información sobre un fenómeno espacialmente continuo medido en sitios específicos.


  • Este tipo de datos puede representar, por ejemplo, los niveles de contaminación del aire registrados en un conjunto de estaciones de monitoreo o datos de encuestas de prevalencia de enfermedades en un conjunto de sitios.

Interpolación espacial


La interpolación espacial es la actividad de estimar valores de variables espacialmente continuas para ubicaciones espaciales donde no se han observado, basándose en observaciones.

La datos asociados a los puntos proporcionan información sobre un fenómeno espacialmente continuo medido en sitios específicos.

Interpolación espacial


Ejemplo

Bivand et al. 2013

Interpolación espacial


Podemos clasificar en dos los métodos de interpolación espacial:

  • los que asumen que los cambios de las variables se dan de forma abrupta (polígonos de Thiessen o de Voronoi y la red de triangulación irregular)
  • los que asumen que los cambios de las variables son graduales (globales, locales y óptimos usando autocovarianza espacial)

Polígonos de Thiessen o de Voronoi

  • se crean al unir los puntos entre sí, trazando las mediatrices de los segmentos de unión. Las intersecciones de estas mediatrices determinan una serie de polígonos en un espacio bidimensional alrededor de un conjunto de puntos de control.
  • los perímetro de los polígonos generados son equidistante a los puntos vecinos y designan su área de influencia.

Polígonos de Thiessen o de Voronoi


  • En epidemiología, los diagramas de Voronoi pueden utilizarse para correlacionar las fuentes de infección en epidemias.
  • Un diagrama de Voronoi divide un espacio en celdas basándose en la distancia a un conjunto de puntos, donde cada punto dentro de una celda está más cerca de su punto asociado que de cualquier otro punto.
  • Una de las primeras aplicaciones de los diagramas de Voronoi fue (de alguna forma) implementada por John Snow para estudiar el brote de cólera de 1854 en Broad Street, Soho, Inglaterra

Ponderación de distancia inversa (IDW)


  • estima valores en ubicaciones desconocidas basándose en valores conocidos en ubicaciones cercanas

  • asigna mayor peso a las observaciones más cercanas, suponiendo que las características más cercanas están más relacionadas

  • método relativamente simple y rápido, pero puede no ser adecuado para áreas con patrones espaciales complejos

Ponderación de distancia inversa (IDW)


  • El método no necesita de variogramas previos.
  • El paquete gstat aplica el método IDW y nos pide definir:
    • formula: en general variable ~ 1
    • nmax: número máximo de vecinos (se establece igual al número total de ubicaciones)
    • idp: potencia de distancia inversa (cuando aumenta se le da menos peso para la estimación a los sitios alejados y por lo tanto mayor a los sitios cercanos)
  • La limitación principal es encontrar el r -idp- (potencia) adecuada.

Patrones espaciales de puntos


Un “patrón espacial de puntos” es un conjunto de datos que proporciona las ubicaciones espaciales observadas de objetos o eventos.

En epidemiología podemos encontrar, por ejemplo:

  • Accidentes de tránsito

  • Casos de enfermedades o muertes

  • Trampas de vectores

  • Delitos

Densidad de kernel (KDE)


Transforma matemáticamente un conjunto de puntos georreferenciados en una superficie continua, es decir, en un mapa de densidades que muestra dónde se concentran más los puntos.

  • Cada punto se rodea con una “campana gaussiana” bidimensional (kernel). Existen otras distribuciones posibles.
  • Las campanas se suman. Donde hay muchos puntos cerca unos de otros, las campanas se superponen y la “altura” (densidad) resultante es mayor, es decir se ponderan los eventos en función de su distancia.
  • Se obtiene una superficie de densidad. El resultado es un mapa que indica la densidad de puntos en cada zona del área de estudio. Cuanto más alto el valor, mayor es la concentración de puntos.

Densidad de kernel (KDE)

  • Se usa para identificar zonas calientes (hotspots) o de concentración, con una estimación precisa de la densidad de eventos en un espacio contínuo.
  • Es clave el control adecuado del ancho de banda (bandwidth). Este ancho de banda controla cuánto se extiende la influencia de cada punto. Si es muy chico, el mapa queda “picado”; si es muy grande, se suaviza mucho y se pierde detalle.
  • Existen distintos métodos para determinar el mejor ancho de banda. Visuales (subjetivos), por escala del fenómeno estudiado y automáticos (por ejemplo: regla de Silverman´s)

Funciones y paquetes en R


  • El paquete sf, ya visto, trae muchas funciones de tranformación útiles: como st_union(), st_intersection(), st_bbox(), st_crop(), etc.
  • Para lograr los polígonos de Voronoi también ofrece la función st_voronoi() al igual que el paquete terra
  • El paquete gstat para el modelado, predicción y simulación geoestadística espacial tiene varias funciones interesantes entre ellas: gstat() que crea objetos de esa clase e idw() para poder interpolar por la inversa distancia ponderada.
  • El paquete spatstat para análisis de patrones de puntos espaciales, junto con raster, permite por ejemplo generar densidades de kernel mediante su función density()